如何从 SPSS 获取(偏)Eta 平方?
By Ruben Geert van den Berg,发表在 ANOVA & 统计 A-Z 下。
在 ANOVA (方差分析) 中,我们_总是_报告:
- F (F 值);
- df (自由度);
- p (统计显著性).
对于每个效应,我们都需要报告这 3 个数值——对于单因素方差分析,可能只有一个效应。现在,p 值(在 SPSS 中显示为“Sig.”)告诉我们,在总体中,某个效应为零的可能性。效应为零意味着对于某个因素(如性别或实验组),所有均值完全相等。
然而,某个效应仅仅是_不为零_,这本身并没有太大的意义,不是吗?我们真正想知道的是:这个效应有多_强_?我们不能仅仅因为 p = 0.05 就断定其效应比 p = 0.10 更强,因为两者都会受到样本量和其他因素的影响。那么,我们如何量化效应的强度,以便在分析内部或跨分析之间进行比较呢? 实际上,有一些 效应量 (effect size) 的度量 可以告诉我们这些信息。其中一个常用的指标是(偏)Eta 平方,表示为 η2(η 是 希腊字母 Eta)。
偏 Eta 平方 - 是什么?
偏 η2 表示某个效应 解释的方差比例。如果你真的_非常_想知道,其计算公式为:
\[partial\;\eta^2 = \frac{SS_{effect}}{SS_{effect} + SS_{error}}\]
其中 SS 是“离差平方和 (sums of squares)”的缩写,代表因变量的离散程度。这意味着偏 η2 是归因于某个效应的方差,除以_可能_归因于该效应的方差。
我们可以通过将 SPSS 的 ANOVA 输出复制粘贴到 这个 GoogleSheet 中来轻松验证这一点 - 以及进行更多计算 - 如下图所示。
请注意,在单因素方差分析中,我们只有一个效应。因此,因变量的方差要么归因于效应,要么归因于误差。因此,对于单因素方差分析:
\[partial\;\eta^2 = \frac{SS_{effect}}{SS_{total}}\]
这等于(非偏)η2。现在让我们开始从 SPSS 获取(偏)η2。
示例:幸福感研究
一位科学家让 120 人对自己的幸福感进行评分,评分范围为 100 分制。其他问题包括就业状况、婚姻状况和健康状况。收集到的数据存储在 happy.sav 中,部分数据如下所示。
我们特别感兴趣的是 就业状况对幸福感的影响:(它们)如何相关,并且这种关联是否取决于健康或婚姻状况?让我们首先使用单因素方差分析来检验就业状况。
单因素方差分析的 Eta 平方 - 选项 1
SPSS 提供了几个运行单因素方差分析的选项,许多学生从 分析 (Analyze) 比较平均值 (Compare Means)
单因素 ANOVA (One-Way ANOVA) 开始,但奇怪的是,η2 完全没有出现在这个对话框中。
因此,我们将使用 MEANS (均值) 命令,如下图所示。
单击 粘贴 (Paste) 会生成以下语法。由于它比必要的要长得多,所以我更喜欢直接输入一个简短的版本,它可以产生相同的结果。让我们运行它。
从 MEANS 命令获取 Eta 平方的 SPSS 语法
***Means command as pasted from menu.
**
MEANS TABLES=happy BY employed
/CELLS=MEAN COUNT STDDEV
/STATISTICS ANOVA.
***Short version (creates identical output).
**
means happy by employed
/statistics.
结果
结果显示:η2 = 0.166:幸福感的所有方差中约有 17% 可归因于就业状况。我认为这不算太多,但肯定不可忽略。
请注意,SPSS 提到的是“关联测量 (Measures of Association)”,而不是“效应量 (effect size)”。有人可能会争辩说这些是可以互换的,但无论如何这有点不一致。
单因素方差分析的 Eta 平方 - 选项 2
也许在 SPSS 中 运行 ANOVA (方差分析) 的最佳方法 是从单变量 GLM (General Linear Model,广义线性模型) 对话框中进行。下面的屏幕截图会指导你完成。
这将生成如下所示的语法。让我们运行它,看看会发生什么。
从 UNIANOVA 获取 Eta 平方的 SPSS 语法
***One-way ANOVA with eta squared as pasted from Analyze - General Linear
Model - Univariate.
**
UNIANOVA happy BY employed
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/PRINT=ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=employed.
结果
我们发现偏 η2 = 0.166。它之前只是表示为 η2,但正如已经讨论过的,对于单因素 ANOVA,它们是相同的。
多因素方差分析的偏 Eta 平方
对于多因素 ANOVA - 涉及多个因素 - 我们可以从 GLM 单变量分析中获得偏 η2,如下所示。
如下图所示,我们现在只需添加多个自变量(“固定因子 (fixed factors)”)。然后,我们勾选 选项 (Options) 下的 效应量估计 (Estimates of effect size),就可以了。
偏 Eta 平方语法示例
***Two-way ANOVA with partial eta squared. Pasted from Analyze - General
Linear Model - Univariate.
**
UNIANOVA happy BY employed healthy
/METHOD=SSTYPE(3)
/INTERCEPT=INCLUDE
/PRINT=ETASQ
/CRITERIA=ALPHA(.05)
/DESIGN=employed healthy employed*healthy.
结果
首先,主要效应(就业和健康)以及它们之间的交互作用在统计上都__显著 (significant)__。就业的影响 (η2 = .095) 是健康的影响 (η2 = 0.048) 的两倍。等等。
请注意,你 不可能从它们的 p 值中得出这个结论(就业的 p = 0.003,健康的 p = 0.018)。虽然这些效应在_统计学上_高度显著,但效应量是中等****。我们通常会在较大的样本量中看到这种模式。
最后,我们不应该真正解释我们的主要效应,因为交互作用在统计上是显著的:F(2,114) = 4.9, p = 0.009。正如在 SPSS 双因素 ANOVA - 基础教程 中解释的那样,我们最好检查 简单效应 (simple effects) 而不是主要效应。
结论
我们可以从 分析 (Analyze) 广义线性模型 (General Linear Model)
单变量 (Univariate) 中获得单因素和多因素 ANOVA 的(偏)η2,但它一次只能处理一个因变量。总的来说,我认为 这是进行任何 ANOVA 的方式,因为它是唯一能让我们获得通常需要的所有输出的选项 - 包括 事后检验 (post hoc tests) 和 Levene 检验。
我们可以使用 分析 (Analyze) 比较平均值 (Compare Means)
均值 (Means) 一次运行多个单因素 ANOVA 和 η2,但它 缺少重要的选项,例如事后检验和 Levene 检验。这些 - 但不是 η2 - 可以从 单因素 ANOVA (One-Way ANOVA) 对话框中获得。除非你需要非常基础的分析,否则这两种选择都相当不方便。
最后,一些作者更喜欢另一种效应量度量,称为 ω2(“Omega 平方”)。不幸的是,SPSS 中似乎完全没有这个选项。至少目前看来,我猜 η2 必须凑合着用了……
我希望这个教程对你有所帮助。感谢阅读!